池梓源|生成式人工智能背景下著作权的刑法保护研究——以ChatGPT为例
以ChatGPT为例的生成式人工智能是具有内容生成能力的大型语言模型,与其他传统人工智能相比,其表现出的“类人性”更强。在收集数据和生成内容两个阶段,生成式人工智能都容易产生侵害著作权的法律风险,刑法应当在坚持前置法优先和解释优先的前提下,对著作权进行保护。目前的生成式人工智能尚且无法具有刑事主体资格,但是并不能否认随着技术的快速发展,其在不久的将来可能成为适格的刑事责任主体。生成式人工智能生成物是侵犯著作权罪的犯罪对象,且其享有的著作财产权有承载主体。具体承载主体的判断应当先根据具体情况,判断出对创作有实质付出的主体作为承载主体,只有在无法区分和判断的情况下,才可将生成式人工智能的生成物视为孤儿作品。在ChatGPT等生成式人工智能作为犯罪工具侵犯他人著作权的情况下,应当坚持以营利为目的的主观要件认定,阶段性的免费或是对部分功能的免费并不影响该目的的认定。
2022年11月,美国的。OpenAI公司发布的生成式人工智能——ChatGPT,迅速引发全球各领域的广泛讨论。科技是把双刃剑,当ChatGPT等越来越多的生成式人工智能为人类生产生活提供重要助力的同时,也对现有的法律体系规范提出了新的难题和挑战。2023年7月13日,《生成式人工智能服务管理暂行办法》(以下简称《暂行办法》)公布,并于8月15日正式施行,这代表着我国已经开始从立法的角度着手,针对性地规范我国生成式人工智能的发展和运用。鉴于生成式人工智能的运行原理,从预训练数据的合理使用,到生成式人工智能生成物的可保护性,每个环节都与知识产权密切相关,一旦脱离监管极易产生涉及知识产权侵权的法律风险。《暂行办法》中也多次强调在鼓励生成式人工智能技术发展的同时,需要注意知识产权的保护。在民商法领域,这些相关问题已经引起了不少学者的关注,尤其是对于人工智能生成物的著作权保护,早已成为热点话题并有诸多学术文章进行研究和讨论。但是,生成式人工智能背景下我国著作权的保护并不能只局限于民商法和行政法领域,刑法作为后置法,也应当守好最后一道防线。在刑法视域下,根据目前ChatGPT等生成式人工智能的技术特点,其可能涉及的侵犯知识产权类犯罪重点集中在侵犯著作权罪上。但是,刑法学界针对生成式人工智能著作权保护的研究成果较少,主要将焦点都放在了更大范围的人工智能及其生成物的保护上,很少根据生成式人工智能的特点进行针对性分析。虽然生成式人工智能是人工智能的一个子领域,但是人工智能的概念非常广泛,不同种类的人工智能在运用的技术原理以及完成任务的能力上也各有不同。生成式人工智能依靠强大的深度学习能力,被认为是目前最接近通用人工智能的产物,其生成内容中所展现出的逻辑性和创造力几乎比以往任何人工智能给现有著作权保护带来的挑战都要大。因此,将生成式人工智能从人工智能这一笼统的大概念中单独提炼出,并针对其特点进行分析研究,具有一定的理论价值和实践指导意义。本文将主要以ChatGPT为例,着眼于对著作权的保护,从生成式人工智能的运行原理及其所带来的著作权安全隐患出发,详细分析在刑法领域内,对生成式人工智能著作权保护的困境及解决方案。
一、ChatGPT的运行原理与著作权刑事风险
以ChatGPT为例的生成式人工智能作为一款功能强大的多模块大型语言模型,在生产生活的多个领域都有非常不错的表现,其运行原理主要可以分为三步:预训练—微调—人工反馈的强化学习。正是因为这种高度类人化的运行原理,ChatGPT等生成式人工智能比传统人工智能更加智能。然而新兴技术在给人们生活带来便利的同时,随之而来的法律风险也应当注意。尤其是具有内容输出功能的生成式人工智能,其对著作权保护带来的挑战尤为明显,在收集数据和生成内容两个阶段,都容易产生侵害著作权的法律风险。
(一)ChatGPT的运行原理
生成式人工智能是一种具有文本、图片、音频、视频等内容生成能力的大型语言模型,其应用非常广泛。例如,在自然语言处理领域,可以用于自动写作、机器翻译和对话系统等任务。在图像处理领域,可以用于图像生成、图像修复和图像增强等任务。本文着重讨论的ChatGPT便是生成式人工智能的典型代表。ChatGPT包含多个版本,其中最新一代的版本是GPT-4,发布于2023年3月。相比于GPT-3.5,GPT-4在模型结构、数据量、预训练方式等方面都有所改进,比GPT-3.5具有更强的语言理解和生成能力,可以进行高级推理并生成和编辑具有创意性或技术性的文章,同时增加了图像的输入方式,不仅能对输入的图片进行简单分析和描述,还能深度解析和搜索图像内容。
从技术层面分析其运行原理,GPT-4在执行自然对话、文字创作、程序代码编写等多种自然语言处理任务时主要分为三步:首先,基于Trans-former架构,实现对重要信息的高效抓取,并采用自注意力(Self-Attention)机制进行无监督的预训练,通过对大量数据自主训练,汲取丰富的语言知识,形成基础大模型。其次,通过微调(Fine-Tuning)技术,根据特定任务微调已有基础数据模型的参数,使其达到更好的性能。通过自然语言形式给出人类指令便是微调技术的一种,可以用以提高语言模型在未知任务上的效果。例如用英语翻译“今天天气真好”。最后,使用人工反馈的强化学习技术优化模型的生成文本,即由人类评估模型生成的文本,并根据其质量和相关性提供反馈,以此来优化语言模型的生成内容。
值得注意的是,在明晰了ChatGPT的运行原理后,不难发现以Chat-GPT为代表的生成式人工智能与传统人工智能从技术的底层逻辑开始就有所不同。生成式人工智能主要模仿人类的心智能力,通过学习大数据并针对不同环境作出适应性调整,从而生成新的内容,其表现出的“类人性”更强。这也是将生成式人工智能进行特别研究的意义所在,前些年一些关于人工智能著作权的理论研究往往直接忽视对技术的区分,将研究对象统称为人工智能。但是,能输出内容的人工智能有很多种,如判别式人工智能。生成式人工智能仅仅是人工智能的一个子领域,其与传统的判别式人工智能在功能和运用原理方面都相去甚远。判别式人工智能往往是通过对标注数据进行训练,此类数据量要远远小于生成式人工智能预训练的数据量,并且其最终功能是引导模型给出问题答案,而“生成式人工智能则是对无标注数据设计基于遮蔽内容还原的自注意力无监督学习任务进行训练,引导模型生成符合上下文语境的内容”。这代表着生成式人工智能能创造出新的高维数据,简言之,生成式人工智能能在给出问题答案的同时提供给使用者得出答案的步骤或原因。所以相对于判别式人工智能而言,生成式人工智能可以说是更加接近智能的本质。
(二)生成式人工智能带来的著作权刑事风险
ChatGPT等生成式人工智能最大的特点是收集大量数据进行预训练,进而生成新的原创内容。所以,在收集数据和生成内容两个阶段,都容易产生侵害著作权的法律风险。
第一,在收集数据阶段。以ChatGPT目前最先进的模型GPT-4为例,为了提高回答问题的准确性和文本的生成质量,据估算GPT-4进行预训练的数据集已经高达1PB,范围包含社交媒体、公共论坛以及其他各种渠道收集到的大型对话数据。尽管OpenAI公司承诺会将用户输入的个人数据等敏感信息进行删除,但并没有公布删除的方式,这仍然不能排除将他人已享有著作权的作品纳入预训练数据集,从而产生的侵害他人著作权的风险。并且,即使OpenAI等生成式人工智能的服务提供者可以通过技术手段将他人已享有著作权的作品排除在预训练的数据集之外,从上文生成式人工智能的运行原理不难发现,GPT-4在对收集的语料库进行自注意力无监督的预训练时,并没有人类的介入和监督,很难保证其不会脱离人类的控制和干预对他人版权作品进行自主收集,或给犯罪分子可乘之机,通过修改架构、加入插件等技术手段获取他人已享有著作权的作品。在现实生活中,ChatGPT未经允许使用他人版权内容的案件层出不穷。2023年9月,知名IP《权力的游戏》《冰与火之歌》《神奇女侠》等作品的原著作者就与OpenAI对簿公堂,要求禁止OpenAI未经授权使用版权作品。
第二,在生成内容阶段。根据OpenAI使用条款的规定,OpenAI对任何用户的输入和输出内容拥有广泛使用权以改善ChatGPT。虽然生成式人工智能生成物是不是作品以及其著作权的归属具有争议,对于这些争议笔者将会在后文予以详细论述,但是需要肯定的是,随着生成式人工智能的技术发展,生成式人工智能生成物成为著作权法意义上的作品是大势所趋。一旦承认生成式人工智能的生成内容满足作品的构成要件,就可以被著作权法所保护,相应地也可能会被纳入刑法侵犯著作权罪的犯罪对象之中。此时,如果有行为人以营利为目的,做出侵犯生成式人工智能生成物著作权的行为,例如未经著作权人许可,将生成式人工智能生成的版权作品进行复制发行或通过信息网络传播,也可能会具有严重的社会危害性。甚至是如。OpenAI使用条款中所述,输出内容本身就有被广泛使用的可能,这也意味着具有版权的生成式人工智能生成物可能会再次被纳入预训练的数据集之中供其他使用者使用。
可见,在著作权领域,生成式人工智能不论是被作为犯罪工具收集使用他人享有著作权的作品,还是以其生成物作为侵犯著作权罪的犯罪对象,对著作权保护的冲击仍然十分明显和普遍,所以其所可能造成的著作权法益损害也应当引起重视。
二、生成式人工智能背景下刑法对著作权保护的困境
在生成式人工智能背景下讨论对著作权的保护离不开刑法的介入,但是目前刑法对涉及ChatGPT等生成式人工智能的侵犯著作权案件仍然面临着诸多理论和实践困境。第一,刑法保护的限度难以把握,既要保护权利人的著作权不受侵犯,又要兼顾新兴技术的发展。第二,对刑法理论中传统的刑事责任主体认定提出了挑战。第三,对犯罪对象、主观方面等具体构成要件进行认定时,存在争议,亟待明确。
(一)刑法保护的限度难以把握
在讨论刑法对生成式人工智能环境下著作权的保护时,无可避免会遇到的基础性问题是:刑法是否应积极介入并充分发挥其机能以预防和控制刑事风险,或是应保持谦抑态度对待人工智能技术的发展。
在生成式人工智能快速发展的时期,对知识产权的侵犯问题变得更加复杂和普遍,针对著作权的侵害行为都对传统的刑法提出了新的挑战。在这种情况下,刑法面临着两种选择。一方面,刑法可以积极介入并充分发挥其机能,以预防和控制刑事风险。这不仅意味着刑法需要配合前置法,通过法律解释尽可能用现有刑法条文惩治犯罪行为,还意味着一旦生成式人工智能逐渐走向成熟,刑法无法规制与其有关的著作权犯罪时,可能还需要根据生成式人工智能技术的特点和犯罪的具体情形,制定相应的刑事法律规定和处罚措施,以确保对犯罪行为的追究和惩罚。刑法的积极介入可以起到威慑作用,减少著作权侵害行为的发生,保护著作权权利人的合法权益和社会秩序的稳定。另一方面,刑法也可以保持谦抑的态度,对生成式人工智能技术的发展持谨慎态度。这意味着刑法在意识到生成式人工智能技术的快速发展和创新可能带来巨大的社会变革和法律挑战的同时,还需要审慎考虑生成式人工智能技术的复杂性和多样性,避免过度干预和限制新兴产业的发展。刑法可以通过与其他相关法律领域的协作和合作,寻求更加综合和灵活的解决方案,以适应生成式人工智能背景下著作权保护的新需求。
(二)刑事责任主体难以确定
若想从刑法视域下保护生成式人工智能相关的著作权,对刑事责任主体的明确是必不可少的。因此,生成式人工智能能否成为刑法意义上的责任主体这一问题又被推上了讨论的热潮。其实自人工智能AlphaGo战胜世界围棋冠军引起轰动后,人工智能的刑事主体地位一直是刑法学界的讨论和研究重点。加之,近年来自动驾驶汽车的事故频发,不少学者提出“弱人工智能”与“强人工智能”的分类,并以辨认能力和控制能力作为判断其是否具有刑事责任能力的标准。但正如上文所述,以ChatGPT为代表的生成式人工智能似乎比以往传统的人工智能更加“智能”。它的涉及灵感源便是来自人类大脑的内部运作,尤其是神经网络,通过深度学习数据集,生成流畅、有逻辑、符合使用者要求的内容。甚至有不少学者将其认为是通用人工智能的一种。当然也有学者持反对意见,认为即使再多的数据和算力,也不能给ChatGPT带来真正的智能。所以,生成式人工智能能否作为刑事责任主体独立承担责任仍需明确。
即使生成式人工智能尚不能作为刑事责任主体,对于可能涉及著作权犯罪的案件,其责任主体应当是生成式人工智能的程序设计者、提供者还是使用者也存在争议。《暂行办法》中明确要求提供者首先应承担信息源责任并对生成内容负责。可见,在行政法层面上,生成式人工智能服务提供者可以作为责任主体,那么在刑法层面是否可以沿用;是否需要通过立法设立单独的罪名,用以针对性地规制生成式人工智能服务提供者的行为;生成式人工智能服务的程序设计者和使用者又是否可以成为责任主体。这些问题也给刑法的归责带来了不小的挑战。
(三)具体认定侵犯著作权罪的困境
目前,根据现阶段ChatGPT等生成式人工智能的发展现状,大部分知识产权类犯罪都集中在对著作权的侵害上。然而,除了上述两个基础性问题之外,在认定具体犯罪构成要件时,往往会由于案件涉及的领域较为新颖,相关司法解释和判例较少,定罪量刑时会出现构成要件认定模糊等问题,急需理论研究的支撑。
首先,由于刑法中的侵犯著作权罪属于典型的法定犯,认定犯罪的前提便是范围上不能超越前置法划定的犯罪圈,程度上必须是穷尽其他法律手段仍然无法打击犯罪时才可以使用刑法。然而,ChatGPT等生成式人工智能的生成物能否成为前置法的保护对象却是亟待解决的一大难题。如果要构成著作权法意义上的作品,其必须满足独创性和智力成果的要求。实践操作过程中,尽管目前最先进的GPT-4似乎已经可以独立完成流畅、准确和有意义的内容,并且当其生成物与人类所创作的作品同时出现时,人类如果不依靠技术手段几乎已经无法将二者进行区分,但是仍然有极大一部分国家和学者坚持生成式人工智能生成物不能进行版权登记。因为,他们认为只有具有人格的自然人才可能表达自己的观点和立场从而形成作品,生成式人工智能目前仍然无法做到对思想和情感的表达。此外,需要明确的是,即使生成式人工智能生成物属于前置法的保护对象,也并不能当然地认为其可以成为刑法上侵犯著作权罪的犯罪对象。“只有在确定刑法规定著作权犯罪所保护的法益涵括权利人基于人工智能生成物所享有的权利时,才能证明人工智能生成物属于著作权犯罪的对象。”所以,生成式人工智能生成物是否能成为刑法中著作权犯罪的犯罪对象也是值得讨论的问题之一。
其次,如果生成式人工智能生成物可以被著作权法视为作品,并且也属于刑法意义上侵犯著作权罪的犯罪对象,那么在进行具体认定时,还有一个漏洞尚待填补和明确,即该作品的著作权是否有适格的承载主体,承载主体又该如何判断。因为当生成式人工智能生成物在被作为作品进行保护时,需要确定权利指向的真正权利人从而判断是否侵权,而存在适格的权利人也是生成式人工智能生成物被刑法保护的基础。按照传统的著作权归属的规则,作品的著作人身权应当属于生成式人工智能,可是生成式人工智能却又因为不具备人格而无法作为著作人身权的承载主体。此时,确定刑法所保护的权利人的著作财产权是否有适格的承载主体显得尤为重要。同时,从ChatGPT等生成式人工智能的运行原理中可以看出,最终其生成的内容在不同环节同时有生成式人工智能服务提供者、程序设计者和使用者等人类的参与,那么他们又能否拥有该作品的著作财产权?
最后,在涉及ChatGPT等生成式人工智能的著作权犯罪中,除了其生成物可能会被作为犯罪对象外,往往ChatGPT等生成式人工智能本身还会以犯罪工具的形式出现。这也是众多知名作家将生成式人工智能的服务提供者告上法庭的原因,他们认为服务提供者以营利为目的,未经允许对他们享有著作权的作品进行了复制发行或通过信息网络进行了传播。但是,目前包括ChatGPT的基础版本在内的众多生成式人工智能服务提供者尚未对其提供的内容生成服务进行收费。此时,是否仍然满足“以营利为目的”的构成要件?同时,还可能出现的情况是,ChatGPT等生成式人工智能使用者以营利为目的将生成式人工智能的生成内容作为自己的作品复制发行或通过信息网络传播,但由于ChatGPT的运行原理,其在使用时并不会被告知生成的内容是他人享有著作权的作品,这种情形下又是否满足侵犯著作权罪中“以营利为目的”的要求?
三、生成式人工智能背景下著作权刑法保护的基础
在生成式人工智能背景下,在解决侵犯著作权罪具体构成要件的认定问题前面临两个基础性理论困境。第一,刑法对于著作权的保护应当有一定限度。要坚持前置法优先,当前置法无法对犯罪行为进行评价时,才可动用刑事手段,且要注意解释优先,即使使用刑法进行规制,也不能随意盲目立法,尽量先对已有法条进行解释。第二,对于ChatGPT等生成式人工智能的刑事责任主体资格问题,目前以ChatGPT为代表的生成式人工智能尚不具备该资格,但是并不能否认随着技术的快速发展,在不久的将来生成式人工智能可能满足刑事责任主体资格的要求,从而成为适格的刑事责任主体。
(一)刑法保护的合理限度
在讨论生成式人工智能背景下刑法对著作权的具体保护问题前,需要明确的便是刑法作为抵制犯罪的最后手段,其一方面需要起到对著作权的保护作用,另一方面又不能过度参与从而抑制新兴技术的发展。为了保证刑法的谦抑性,控制刑法对生成式人工智能著作权保护的限度,笔者认为应当从以下几个方面入手。
第一,坚持前置法优先。侵犯著作权罪在刑法中属于法定犯,这意味着其必须符合双重违法性的特征,在具有刑事违法性的同时,还需要满足行政违法性。所以,提高生成式人工智能的行政监管力度,以降低刑事风险的可能性显得尤为重要。2023年8月起开始实施的《暂行办法》便是我国针对生成式人工智能颁布的行政性法规。该文件不仅明确了生成式人工智能的定义,以及相关产品和服务提供者的合规义务和法律责任,还提出对生成式人工智能进行专项监管,逐步完善中国生成式人工智能法律体系。这也体现出了《暂行办法》与之前颁布的《互联网信息服务深度合成管理规定》的区别,《暂行办法》是基于对大数据集深度学习的技术逻辑来设计监管制度,而《互联网信息服务深度合成管理规定》则是以生成合成类算法作为规制对象,这是我国对“算法—深度合成—生成式人工智能”规制的制度体系迭代路径,也是逐渐根据技术发展,将生成式人工智能纳入监管的第一步,相信此类行政法律法规会逐步完善,使生成式人工智能的使用和发展更加规范化。与此同时,除了行政性法规,著作权法等前置法也应在进行刑事认定前积极发挥作用。刑法的谦抑性要求是一种传统观点,强调刑法是作为最后手段性、补充性或后盾性的手段,只有当穷尽前置法后仍然无法对行为进行评价时,才可以动用刑法。
第二,坚持解释优先。法律的滞后性导致法律法规在面临社会、科技的快速发展时难免会显得力不从心。生成式人工智能作为目前世界上最先进、最热门的技术之一,其涉及的犯罪行为可能会运用到各种闻所未闻的技术手段和模式,使得传统的刑法规范可能无法直接适用。此时,司法工作人员有两种解决路径:解释和立法。笔者认为,两种路径之间应当优先选择对已有法条进行合理解释,因为刑法需要遵守稳定性原则。根据立法法的规定,我国对于刑法的制定和修正程序非常严格,从1997年现行刑法颁布实施至今,仅有11个修正案。与对刑法进行修正增加新的规范相比,通过各种解释方法对刑法现有条文进行解释能够在不改动现有条文的前提下,以最低的规范成本实现对犯罪的有效规制。所以,在涉及新兴技术犯罪行为的规制方面,优先对刑法进行解释可以极大程度保证刑法的稳定性以及公民的预测可能性,同时也能做到对犯罪行为的有效惩治。
综上所述,随着社会的发展和变化,特别是在面对新兴技术和复杂犯罪形态的挑战时,虽然刑法的谦抑性要求也受到了一定的质疑,但是笔者仍然认为刑法的积极预防和控制刑事风险的限度应当有所限制。这一限制具体表现在,需要坚持前置法优先的原则,只有当其他法律手段无法达到预期效果时,才可以适用刑法。在刑法介入后,也应当注意解释优先于立法,不能将对所有新型犯罪的规制全部依赖于立法,对已有规范进行合理解释也至关重要。
(二)刑事责任主体的确定
生成式人工智能的高度发展无疑是对传统刑事责任主体认定的挑战。生成式人工智能的运行原理有部分灵感便是来源于人脑的思维模式,并且以最先进的GPT-4为例,GPT-4在算法、算力和数据加持下,能够读懂并分析使用者输入的文字和图片,通过对各种数据集的深度学习从而生成符合要求的最终内容。可见,GPT-4与以往的人工智能相比,所具备的内容生成能力和推理能力是遥遥领先的。同时,GPT-4在学术领域的专业问题测试上甚至能打败人类。根据OpenAI公布的数据,GPT-4在Bar考试里击败了90%的人类,在SAT阅读考试中击败了93%的人类,在SAT数学考试里击败了89%的人类。这些强大的功能似乎无一不在向公众表示,生成式人工智能似乎已经拥有了部分“智力”,并逐渐向通用人工智能的领域迈进。所以,在刑法学界也有不少学者认为,生成式人工智能存在具体辨认和控制能力的可能,已经具备成为刑事责任主体的可能性。当然,也有学者持反对意见,认为人工智能没有自由意志,不能具有刑事责任主体资格。
对于生成式人工智能的刑事责任主体资格,笔者认为目前以ChatGPT为代表的生成式人工智能尚不具备该资格,但是并不能否认随着技术的快速发展,其在不久的将来可能满足刑事责任主体资格的要求,从而成为适格的刑事责任主体。刑事责任能力是适格的刑事责任主体存在的基础,该能力包括辨认和控制自己行为的能力,而独立的意识和意志又是判断是否具有这些能力的标准。很显然,以目前生成式人工智能的发展水平,将其认定为有独立意识和意志的个体有些为时过早。GPT-4作为迄今为止最强大的生成式人工智能之一,其进行预训练的数据集里缺少人与人之间的表情、姿态等多模态信息,这使其获取到的原始数据本身就在思想和情感方面具有一定的局限性。仍然无法到达在没有人为干预的情况下进行自主创作的程度,类似于人类或超越人类智能的通用人工智能仅具有在未来出现的理论可能性。但是,不可否认,GPT-4是目前最接近通用人工智能的产物,很可能由于技术的发展以及其算法本身的“黑箱”特质,未来将出现超出程序限制之外,在独立的意识和意志支配下实施严重危害社会行为的强人工智能,此时该生成式人工智能将无疑会被纳入刑事责任主体的范围之中。
既然目前的生成式人工智能尚且无法具有刑事主体资格,那么在认定相关著作权犯罪时,就需要对各环节的参与人进行判断,即对生成式人工智能的使用者、提供者、设计者等主体进行归责。这种归责方式本质上仍然是传统的自然人责任的规则模式,只是应用场景变为了生成式人工智能的背景。前置法中强调生成式人工智能服务提供者的义务与责任也正是在为刑法的后续介入提供条件。鉴于此,有学者提出在刑法中可以参照拒不履行信息网络安全管理义务罪,增设专门针对生成式人工智能服务提供者的罪名——拒不履行人工智能安全管理义务罪,追究未履行预见、监督义务的生成式人工智能服务提供者的刑事责任。如上文所述,笔者认为对于刑法条文的增设应当慎之又慎,尤其是在新兴技术领域刚刚起步开始发展的时期,刑法的介入应坚持前置法和解释优先。目前,对于生成式人工智能服务提供者的归责问题可以先从行政法和民法的角度进行救济,如果必须使用刑法进行评价时也可以考虑从共犯的角度进行规制,盲目增设罪名有过分超前立法之嫌,不利于新兴技术的发展和推广。所以,只要生成式人工智能的使用者和提供者是具有刑事责任能力的主体,且符合具体犯罪的构成要件,就可以被刑法所规制。至于具体责任的归属应当根据具体案件进行认定和分析。
四、生成式人工智能背景下侵犯著作权罪认定困境的解决
在对侵犯著作权罪具体构成要件进行分析时,ChatGPT等生成式人工智能的生成物是著作权法意义上的作品,同时也满足刑法中侵犯著作权罪犯罪对象的要求。刑法中侵犯著作权罪保护的是著作财产权,其权利承载主体应当根据“出力原则”先对各环节参与主体的贡献进行判断,如果实在无法确定权利人,则可以将生成式人工智能生成物视为孤儿作品。以营利为目的的主观要件仍应当保留,阶段性的免费或是对部分功能的免费并不影响该目的的认定。
(一)生成式人工智能生成物是侵犯著作权罪的犯罪对象
首先,生成式人工智能生成物是著作权法意义上的作品。生成式人工智能生成物是否应当受到著作权法保护一直是近年来民商法领域的学者所重点探讨的问题。2023年3月,美国版权局发布《版权登记指南》,坚持人工智能生成物不能版权登记。但在国内,有相当一部分学者认为,虽然目前的生成式人工智能尚属于弱人工智能时代的人工智能,但是只要其满足独创性、智力成果等作品构成要件,就具有著作权法意义上的可版权性。当然也有部分学者持反对意见,认为生成式人工智能生成物的本质只是算法、规则和模板应用的结果,缺乏内在人格基础。笔者认为虽然生成式人工智能的运行离不开程序和模型,但是从生成物输出的过程来看,其中人类的充分参与也完全可以体现其具有人格基础。所以,只要其满足独创性和智力成果的要求,就应当被认定为作品。独创性要求源于本人、独立完成,同时具有最低程度创造性。对于ChatGPT等生成式人工智能来说,一旦其模型设定完毕,后续与使用者交互时的内容输出都是由ChatGPT独立完成的,且并不是对其他作品的简单复制,所以也满足最低程度创造性的要求。至于智力成果的要求,ChatGPT等生成式人工智能被认为是目前最接近通用人工智能的产物,其展现出的高度类人特征与智慧不言而喻。并且,如前所述,从ChatGPT的运行原理看,“基于人类反馈的强化学习”训练模式使其输出内容的过程本身就是在模拟人类的创作过程,只是其所依赖的数据集要远远大于人类,且创作时间要比人类短得多。人类在进行创作前一般也需要收集资料进行学习,然后在一定的规则和要求下进行创作,最后可能也会吸取他人意见,对内容进行修改并生成最终的作品。所以,从整个创作过程的角度上看,ChatGPT等生成式人工智能的生成物完全符合智力成果的特征,且与人类作品几乎没有区别,其成为著作权法意义上的作品具有一定合理性。
其次,著作权法将ChatGPT等生成式人工智能的生成物认定为作品并不意味着其一定会成为刑法中侵犯著作权罪的犯罪对象,“只有在确定刑法规定著作权犯罪所保护的法益涵括权利人基于人工智能生成物所享有的权利时,才能证明人工智能生成物属于著作权犯罪的对象”。刑法规定著作权犯罪所保护的法益主要是著作财产权,所以即便生成式人工智能尚且无法成为刑法意义上的主体,也并不影响其生成物成为侵犯著作权罪的犯罪对象。因为著作财产权和著作人身权是可以分离的,生成式人工智能不具有“人格”,并不影响其作品具有一定经济价值。著作财产权是作者和其他著作权人享有的以特定方式利用作品并获得经济利益的专有权利。对于生成式人工智能的权利人来说,其完全可以通过复制发行等“特定方式”利用作品从而获得收益。
(二)基于生成式人工智能生成物所享有的著作财产权有承载主体
虽然可以明确,ChatGPT等生成式人工智能的生成物可以作为刑法中侵犯著作权罪的犯罪对象,但是仍然有一个基础性漏洞尚待填补,即基于生成式人工智能生成物所享有的著作财产权是否有承载主体。“在著作人身权和著作财产权可以分离的前提下,承认人工智能生成物所承载的著作人身权没有适格主体,并不意味着承认人工智能生成物所承载的著作财产权没有适格主体。”笔者赞同这一观点,因为著作财产权是可以被转让的,这也意味着它并不像著作人身权一样,只能由生成作品的生成式人工智能本身享有,它是有可能由生成式人工智能的程序设计者、服务提供者或使用者等自然人所享有的。甚至还有学者提出,可以设立专门机构,将生成式人工智能生成物视为孤儿作品,由该机构作为著作财产权的承载主体。这种可能性在著作权法中也是有先例可以比照的,如著作权法中视法人为作者和将著作权归属于投资者的规定。所以,ChatGPT等生成式人工智能的生成物可以作为刑法中侵犯著作权罪的犯罪对象是完全合理的,刑法中侵犯著作权罪所保护的著作财产权是可以找到承载主体的。
至于著作财产权的承载主体究竟是生成式人工智能的程序设计者、服务提供者还是使用者,亦或是专门的管理机构。笔者认为,应当根据“出力原则”先对各环节参与主体的贡献进行判断,如果实在无法确定权利人,则可以将生成式人工智能生成物视为孤儿作品由该机构作为著作财产权的主体。因为刑法对著作权进行保护的初衷之一便是激励创作,如果“一刀切”地将所有生成式人工智能生成物的权利人都归属于特定机构,无法对创作起到激励作用,也不利于生成式人工智能的推广应用与发展。并且,从ChatGPT等生成式人工智能使用的现实情况中看,生成式人工智能的作用更加类似于人类从事创造性实践活动的辅助工具,其在技术发展上还没有达到可以具有独立的意识和意志,从而脱离程序设计或人类参与而完成作品的程度。虽然从形式上看,ChatGPT等生成式人工智能生成物是由人工智能最终输出的,但其创作前提必须有程序的设计和研发,创作过程也离不开与使用者交互时的反馈。所以,应当先根据具体情况,判断出对创作有实质付出的主体作为承载主体,只有在无法区分和判断的情况下,才可将生成物视为孤儿作品。
(三)“以营利为目的”的认定
刑法第217条侵犯著作权罪是典型的目的犯,法条中明确规定了犯罪的构成要以“以营利为目的”,即在犯罪故意之外还存在营利目的的主观要素。但是,随着社会和技术的发展,针对著作权的侵犯行为有时会出现不具有营利的目的,但也会给权利人带来重大损失的情况。对于此类情形,主张对著作权的侵犯不必限制以营利为目的的呼声越来越高。自从2001年修订通过的著作权法删除了关于“以营利为目的”的规定后,更是有不少学者提出从维护法律体系内部的协调性出发,刑法在侵犯著作权罪中也应当通过修正取消以营利为目的的要求,在主观上要求故意即可。其理由主要有三:第一,与其他国家以及国际上的相关规定接轨;第二,降低司法工作人员查处犯罪的证明难度;第三,适应目前网络、大数据等科技快速发展的现状。笔者认为,在生成式人工智能的背景下,“以营利为目的”的构成要件仍然有其存在的必要。虽然很多国家的刑法规范中并不要求行为人具有营利的目的,但法律的制定要根据各国实际情况进行判断,不能盲目借鉴。并且,以营利为目的是人的一种主观心理态度,不是仅仅停留在其大脑中的纯主观思维活动,它必然要支配行为人客观的犯罪活动,从而可以通过犯罪前、犯罪中、犯罪后的一系列客观外在活动表现出来。所以,对于司法工作人员来说并非毫无依据。即使在科技的发展下,出现行为人不以营利为目的,而是出于提高知名度或点击率等目的实施侵犯著作权的行为,其最终目的往往也是从中获取利益。正如ChatGPT的研发公司OpenAI,其一开始推出GPT-3.5等基础版本时并没有向公众收取费用,但是随着ChatGPT获得的社会关注度越来越高,点击率和用户数量也在不断攀升,OpenAI很快便开启了收费模式,上线ChatGPT Plus订阅计划。这种在产品推广之初为吸引用户免费提供服务,并在用户达到一定黏性后推出需要收费的高级版本,虽然表面上并没有直接以营利为目的,但是综合犯罪前、犯罪中、犯罪后的一系列客观外在活动可以看出其本质目的仍然是营利。这种模式也完全符合“两高一部”在2011年1月12日颁布的《关于办理侵犯知识产权刑事案件适用法律若干问题的意见》中的规定。所以,刑事制裁手段的严厉性标志着刑法对著作权的保护要适度,当通过对以营利为目的进行合理扩大解释的情况下,可以涵盖目前司法实践中的大部分问题时,就应当尽量慎重降低侵犯著作权罪的入罪门槛。在行政法和民法领域中还有较大的调和空间,行政机关也有专业执法力量的情况下,对于侵犯著作权罪此类轻罪,不应盲目取消犯罪构成要件的要求。
因此,对于OpenAI等生成式人工智能服务的提供者,如果其所提供的模型没有经过著作权人许可,在预训练收集数据的时候对他人已享有著作权的作品进行了永久性复制,或在与使用者交互时直接将作品输出,则具有侵犯著作权罪的可能。综合其开发模型的目的来看,阶段性的免费或是对部分功能的免费,并不能否认其本质具有营利的目的。至于使用者在未知的情况下直接将他人已享有著作权的作品视为自己作品复制发行,笔者认为从主观恶性的角度看,并不符合故意的构成要件。除非生成式人工智能服务提供者明确标注,使用者在与模型进行交互时基本没有知道信息来源的可能,从而也无法得知生成式人工智能的生成内容属于版权作品,不应将这种情况纳入刑法的规制之中。
结语
以ChatGPT为代表的生成式人工智能已经成为改善人类工作效率的重要工具,其通过对大量真实、准确、多样态的训练数据进行深度学习,最终不仅可以根据使用者输入的文字内容进行对话,而且还能根据使用者的需要生成有一定创造性和逻辑性的论文、诗歌、绘画、作曲、程序代码等内容。尽管ChatGPT等生成式人工智能给人类工作生活带来了极大的便利,但是其所带来的法律风险也不容忽视。其中,在知识产权领域,最为明显的便是对著作权保护的冲击。各国相继颁布法律法规规范生成式人工智能的使用,我国出台的《暂行办法》也充分考虑了生成式人工智能的发展与风险治理之间的关系,一方面提出要鼓励生成式人工智能的大力发展,另一方面也明确了生成式人工智能的法律底线。但是,仅仅在行政法和民法领域对生成式人工智能背景下的著作权进行保护并不能满足所有情形,在坚持前置法优先、解释优先的原则下,刑法也应当起到一定作用,以激励更多的主体持续不断地投入创新活动中去。在刑法视域下,Chat-GPT等生成式人工智能既可以作为犯罪工具,在收集数据阶段对他人的版权作品构成威胁,也可以视其生成物为犯罪对象,纳入刑法的保护范围之中。在具体犯罪认定时,在ChatGPT等生成式人工智能作为犯罪工具侵犯他人著作权的情况下,应当坚持以营利为目的的主观要件认定,阶段性的免费或是对部分功能的免费并不影响该目的的认定。
往期精彩回顾
曹化 蒋昊|数据犯罪的刑事治理王魏|数字社会背景下数据犯罪与可持续理念的协调性研究刘志超|帮助信息网络犯罪活动罪和掩饰、隐瞒犯罪所得罪的法律适用问题
目录|《上海法学研究》2022总第8卷丁一|习近平关于网络法治的重要论述及其实践路径段一鸣|刑事远程审判的程序正当性重构
上海市法学会官网
http://www.sls.org.cn